課程資訊
課程名稱
統計學習
Statistical Learning 
開課學期
109-1 
授課對象
學程  生物統計學程  
授課教師
邱春火 
課號
Agron5097 
課程識別碼
621 U7040 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四6,7,8(13:20~16:20) 
上課地點
農藝112 
備註
先修課程: 統計學
限學士班三年級以上
總人數上限:30人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1091Agron5097_ 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

隨著各行各業“大數據”相關問題的激增,統計學習已成為許多科學領域(如:行銷,經濟,農業,生態學…等等)的一個非常熱門的研究方法。統計學習是利用統計建模去理解複雜數據集的一門學問,同時也是結合統計理論架構與計算機科學實務方法的一項工具。 

課程目標
幫助修課同學了解統計學習相關方法的理論架構,並具備分析資料的實務操作能力。

課程大綱(中英文):
主要包含五個部分:
1.預測問題的相關統計方法:
a.Simple/multiple linear regression, Ridge regression, Lasso regression
b.polynomial regression, regression spline, smooth spline, generalized additive model。
2.分類問題的相關統計方法:
K-Nearest Neighbors, Logistic regression, Linear Discriminant Analysis, Quadratic Discriminant Analysis。
3.決策樹相關方法:
Decision tree, regression tree, classification tree, Bagging, Random forests, Boosting.
4.支持向量機 (Support Vector Machines)
5.非監督式學習:clustering approaches. 
課程要求
統計學(必要),線性模型(建議)
課程內容會採用R軟體進行演練。


成績評量方式(中英文):
作業60% (以利用程式語言分析資料為主) 及 期末報告40%
Homework (real data analysis for each topic) 60%, final report and presentation 40% 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
待補 
參考書目
An Introduction to Statistical Learning: With Applications in R (2017) James, Gareth. Witten, Daniela. Hastie, Trevor. Tibshirani, Robert 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第1週
9/17  Introduction and
Random sample vs. Big data 
第2週
9/24  Statistical learning and
Bias vs. Variance 
第3週
10/01  放假 
第4週
10/08  linear regression 1 
第5週
10/15  linear regression II 
第6週
10/22  Classification  
第7週
10/29  Resampling Methods 
第8週
11/05  Linear Model Selection and Regularization I 
第10週
11/19  Linear Model Selection and Regularization II: ridge and Lasso
Linear Model Selection and Regularization III: PCA and PLS 
第11週
11/26  Beyond linearity 
第12週
12/03  Tree-based methods 
第13週
12/10  SVM 
第14週
12/17  PCA and Cluster 
第15週
12/24  oral presentation I 
第16週
12/31  oral presentation II 
第17週
1/07  oral presentation III